Mạng nơron tích chập là gì? Các công bố khoa học về Mạng nơron tích chập

Mạng nơron tích chập (Convolutional Neural Network - CNN) là một kiểu mạng nơron nhân tạo được thiết kế đặc biệt để xử lý dữ liệu có cấu trúc lưới như ảnh, âm t...

Mạng nơron tích chập (Convolutional Neural Network - CNN) là một kiểu mạng nơron nhân tạo được thiết kế đặc biệt để xử lý dữ liệu có cấu trúc lưới như ảnh, âm thanh.

CNN được gọi là "tích chập" bởi vì nó sử dụng phép tích chập để trích xuất các đặc trưng quan trọng từ dữ liệu đầu vào. Quá trình này tương tự như việc sử dụng bộ lọc (filter) để nhận diện các đặc trưng khác nhau trong ảnh.

CNN được cấu thành bởi các tầng chính, bao gồm:

1. Tầng đầu vào (Input Layer): Nhận dữ liệu đầu vào (ví dụ: ảnh) và truyền qua tầng tiếp theo.
2. Tầng tích chập (Convolution Layer): Áp dụng phép tích chập để trích xuất các đặc trưng từ dữ liệu đầu vào.
3. Tầng gộp (Pooling Layer): Giảm kích thước của đầu ra từ tầng tích chập bằng cách chọn giá trị lớn nhất hoặc trung bình của các vùng dữ liệu.
4. Tầng kết nối đầy đủ (Fully Connected Layer): Nhận các đặc trưng đã được trích xuất từ các tầng trước đó và thực hiện phân loại.
5. Tầng đầu ra (Output Layer): Trả về kết quả phân loại.

CNN đã được chứng minh là rất hiệu quả trong nhiều nhiệm vụ như nhận dạng ảnh, phân loại văn bản, nhận diện giọng nói, và có ứng dụng rộng rãi trong ngành công nghệ thông tin và trí tuệ nhân tạo.
Để hiểu chi tiết hơn về mạng nơron tích chập, hãy xem xét cấu trúc và hoạt động của nó:

1. Tầng đầu vào (Input Layer):
- Nhận dữ liệu đầu vào, ví dụ: ảnh kích thước N x N pixels.
- Dữ liệu từ ảnh có thể được biểu diễn dưới dạng ma trận 2 chiều (N x N) hoặc ma trận 3 chiều (N x N x 3) nếu ảnh là ảnh màu.

2. Tầng tích chập (Convolution Layer):
- Gồm một số bộ lọc (filter) được áp dụng lên dữ liệu đầu vào.
- Mỗi bộ lọc có kích thước nhỏ hơn hoặc bằng kích thước đầu vào và thực hiện phép tích chập trên dữ liệu.
- Quá trình tích chập sẽ tính toán tổng trọng số của các pixel trong vùng tương ứng và tạo ra đầu ra là một ma trận đã được lọc.
- Phép tích chập giúp trích xuất các đặc trưng quan trọng như cạnh, gốc, vùng tối sáng,...

3. Tầng gộp (Pooling Layer):
- Mục đích của tầng này là giảm kích thước không gian của dữ liệu để giảm độ phức tạp tính toán và số lượng tham số.
- Có các phép gộp thông thường như phép gộp cực đại (max pooling) hoặc phép gộp trung bình (average pooling).
- Tầng gộp giữ lại các đặc trưng quan trọng nhất trong vùng quét và loại bỏ thông tin không quan trọng.

4. Tầng kết nối đầy đủ (Fully Connected Layer):
- Tập hợp các đặc trưng đã được trích xuất từ tầng trước đó và đưa vào một hoặc nhiều tầng kết nối đầy đủ.
- Các tầng này chứa các nơron được kết nối hoàn toàn với tầng trước.
- Hàm kích hoạt (ví dụ: ReLU) được áp dụng cho đầu ra của từng nơron trong tầng này.

5. Tầng đầu ra (Output Layer):
- Đưa ra dự đoán cho tác vụ phân loại hoặc dự báo.
- Phụ thuộc vào nhiệm vụ cụ thể, hàm kích hoạt cuối cùng có thể là softmax (cho phân loại) hoặc tuyến tính (cho dự báo).

Qua các tầng trên, mạng nơron tích chập học cách trích xuất và hiểu thông tin quan trọng từ dữ liệu đầu vào. Điều này cho phép nó tìm hiểu các đặc trưng tương tự trong các vùng không gian khác nhau của ảnh hoặc dữ liệu và sử dụng các đặc trưng này để phân loại hoặc dự báo.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề mạng nơron tích chập:

MÔ HÌNH MẠNG NƠRON TÍCH CHẬP ĐA NHIỆM NHẬN DẠNG KHUÔN MẶT VÀ BIỂU CẢM CHO ỨNG DỤNG HỖ TRỢ GIÁM SÁT HỌC TRỰC TUYẾN
Hệ thống quản lý học tập trực tuyến (LMS) đang được phát triển mạnh, góp phần nâng cao chất lượng đào tạo. Tuy nhiên, việc tăng cường giám sát và hỗ trợ người học, theo dõi và quản lý học tập dựa trên các công nghệ hiện đại chưa được nghiên cứu sâu rộng. Đặc biệt là ứng dụng của công nghệ nhận dạng khuôn mặt và biểu cảm khuôn mặt giúp cho việc theo dõi, giám sát người học được tự động hoá cao độ v...... hiện toàn bộ
#Mạng nơron tích chập đa nhiệm #nhận dạng khuôn mặt #nhận dạng biểu cảm khuôn mặt #hệ thống quản lý học tập trực tuyến
Chỉ Tiền Xoay Tại Giai Đoạn Suy Diễn: Một Phương Pháp Để Đạt Được Tính Bất Biến Với Sự Xoay Của Mạng Nơron Tích Chập Dịch bởi AI
International Journal of Computational Intelligence Systems - Tập 17 Số 1
Tóm tắtCác mạng nơron tích chập (CNN) phổ biến cần phải tăng cường dữ liệu để đạt được tính bất biến với sự xoay. Chúng tôi đề xuất một cơ chế thay thế, Chỉ Tiền Xoay Tại Giai Đoạn Suy Diễn (PROAI), để làm cho CNN bất biến với sự xoay. Ý tưởng tổng quát là học cách mà não người quan sát hình ảnh. Tại giai đoạn huấn luyện, PROAI huấn luyện một CNN với một số lượng n...... hiện toàn bộ
PHƯƠNG PHÁP ƯỚC LƯỢNG GÓC NHÌN DỰA TRÊN ĐIỂM 3D ĐẶC TRƯNG KHUÔN MẶT VÀ ỨNG DỤNG GIÁM SÁT THI TRỰC TUYẾN
Ước lượng góc nhìn khuôn mặt (HPE) là một bài toán phức tạp đòi hỏi sự kết hợp giữa xử lý hình ảnh, thị giác máy tính và kỹ thuật học máy với các phương pháp hiện nay dựa trên mạng nơron tích chập (CNN) để xác định ánh xạ giữa không gian ảnh 2D và mô hình 3D khuôn mặt và xác định các góc nhìn. HPE được ứng dụng trong nhiều vấn đề thực tiễn và có ý nghĩa cao như các giám sát an ninh, phát hiện sự t...... hiện toàn bộ
#Giám sát thi trực tuyến #thị giác máy tính #mạng nơron tích chập #hồi quy rừng ngẫu nhiên
Thiết kế Mạng Nơron Tích Chập Sâu cho phân loại chữ ký theo loại của hình ảnh vệ tinh panchromatic thô Dịch bởi AI
Multimedia Tools and Applications - - 2022
Phân loại chữ ký theo loại từ xa đã đạt được những ý nghĩa quan trọng trong phân tích hình ảnh có độ phân giải không gian do sự khác biệt trong phản ứng không gian của cảm biến và biến đổi bề mặt. Do đó, tính chất kết hợp độ xám của các đặc trưng kết cấu tỉ lệ xác suất cho nhiệm vụ phân loại là rất quan trọng. Truyền thống, các bộ phân loại dựa trên học sâu Mạng Nơron Tích Chập (CNN) cho các chữ k...... hiện toàn bộ
Mạng nơron tích chập cấu trúc cây cho phân loại giới tính và độ tuổi dựa trên dáng đi Dịch bởi AI
Multimedia Tools and Applications - Tập 82 - Trang 2145-2164 - 2022
Phân loại giới tính và ước lượng độ tuổi là những nhiệm vụ mà con người thực hiện rất tốt. Nếu giới tính và độ tuổi của con người có thể được nhận diện tự động từ hình ảnh, điều này sẽ rất hữu ích cho nhiều ứng dụng như giám sát thông minh, tiếp thị vi mô, v.v. Chúng tôi đề xuất một khung công tác cho việc phân loại giới tính và độ tuổi qua phân tích dáng đi. Nhận diện dựa trên dáng đi là một phươ...... hiện toàn bộ
#phân loại giới tính #ước lượng độ tuổi #dáng đi #mạng nơron tích chập #Hình ảnh Năng lượng Dáng đi
Chia sẻ trọng số trong các lớp nông thông qua các phép tích chập tương đương nhóm quay Dịch bởi AI
Springer Science and Business Media LLC - Tập 19 - Trang 115-126 - 2022
Phép toán tích chập có đặc tính equivariance nhóm dịch chuyển. Để đạt được nhiều tính chất equivariance nhóm hơn, các phép tích chập tương đương nhóm quay (RGEC) được đề xuất nhằm đạt được cả tính chất equivariance nhóm dịch chuyển và quay. Tuy nhiên, các công trình trước đó tập trung nhiều hơn vào số lượng tham số mà thường bỏ qua các chi phí tài nguyên khác. Trong bài báo này, chúng tôi xây dựng...... hiện toàn bộ
#RGEC #chia sẻ trọng số #tính trực giao #mạng nơron sâu #phép tích chập nhóm quay
TÌM KIẾM ẢNH SỬ DỤNG MẠNG NƠRON TÍCH CHẬP VÀ ĐỒ THỊ PHÂN CỤM
Trong bài báo này, một mô hình tìm kiếm ảnh dựa trên mạng nơron tích chập kết hợp cấu trúc đồ thị cụm được thực hiện nhằm nâng cao hiệu suất và giảm thời gian truy vấn ảnh. Để thực hiện bài toán này: (1) mạng Noron tích chập được sử dụng để xác định và phân loại các đối tượng trên ảnh; (2) cấu trúc đồ thị cụm được xây dựng để thực hiện xây dựng ontology; (3) tập ảnh tương tự được trích xuất dựa ...... hiện toàn bộ
MÔ HÌNH MẠNG NƠRON TÍCH CHẬP THỂ NHẸ DỰA TRÊN KIẾN TRÚC DENSENET CHO NHẬN DẠNG BIỂU CẢM KHUÔN MẶT VÀ ỨNG DỤNG HỖ TRỢ ĐÁNH GIÁ QUÁ TRÌNH HỌC TẬP TRỰC TUYẾN
Mạng nơ-ron tích chập (CNN) được áp dụng cho nhận dạng cảm xúc trên khuôn mặt đang được quan tâm nghiên cứu của nhiều tác giả với những kết quả rất khả quan và có các ứng dụng thành công. Các mô hình CNN hiện đại được thiết kế với các kiến trúc đa dạng như VGG, ResNet, Xception, EfficientNet, DenseNet và các biến thể của chúng được áp dụng rộng rãi cho các bài toán nhận dạng hình ảnh, trong đó có ...... hiện toàn bộ
#Mạng nơron tích chập #kiến trúc mạng DenseNet #nhận dạng biểu cảm khuôn mặt #hệ thống quản lý học tập trực tuyến
Tổng số: 13   
  • 1
  • 2